十份“封关”民调准确率评估
在《十份台湾地区“封关”民调》里,星星总结了台湾地区两项选举的10份“封关”民调情况,其中有8份传统民调和2份大数据民调。
选举结束正好一周,可以看看哪家民调更准,哪家不准?
传统民调:“联合报”
对于传统民调,星星做了数据处理,将“其他”的数字划入三人支持率,划分比例按照三人已知的支持率。
整理出来的情况如下表:
1月13日的选举结果,赖清德40.05%,侯友宜33.49%,柯文哲26.46%,差距6.56%
比对一下上面的情况,可以发现最为接近的是“联合报”的民调,都是小数点后的差距。几乎可以说是完美预测。
把上面8份民调,三人预测支持率和实际结果进行比较,利用绝对值函数(ABS),求出偏差总和排列:
可以得到下表:
从上表看到,“联合报”最准确,而“美丽岛电子报”最不准……
这好像和我们的印象不太一样。在选前,大多数研究者包括星星在内,都把“美丽岛电子报”作为重要的参考依据。
星星这种检测方法未必科学,在此也列举台湾相关方面对民调的分析作为参考。
不管怎么分析,民众党的民调肯定是最不准的……
大数据民调:“无情真实的未来预测”
接着是两份大数据民调。它们采用人工智能技术,通过大数据得出预测结论。
“选战温度计”的预测结果如下:
对比结果,“选战温度计”领导人选举是有重大预测错误。
预测赖侯差距1%,属于胶着态势;实际差距6.5%……总体而言,高估了侯友宜,低估了柯文哲。
联想到柯文哲的网络声量本来更高,这样的一份大数据预测的准确率就要更打上问号了。
民意代表的席次倒是相对准确,但由于是总数估计,其实参考价值不大。
“选战温度计”的总结倒是避重就轻,自称:领导人选举预测成功,民意代表席次命中率97.3%。
对于这番自吹自擂,星星较为不认可。
再看“无情真实的未来预测”。
它的检讨倒是比较认真,列出了自己预测的差距(赖清德+0.1%,侯友宜-4.5%,柯文哲+4.5%),实际上也高估了侯友宜,低估了柯文哲。
在民意代表席次中,这家对每个选区都做出了预测,列出了错误选区和原因。星星认为,这是实事求是的态度,值得点赞。
在未来的选举预测中,星星也将会更加看重这份大数据民调。
错误的选区有5个:台北5(胜负难料)/新北10(五五波)/彰化1(五五波)/彰化2(五五波)/澎湖县(未列原因)
不分区和少数民族全对。
整份预测准确率108/113,交出了95分的高分答卷。
综合全文,此次两项选举里,最准确的传统民调是“联合报”,最准确的大数据民调是“无情真实的未来预测”。